Human Activity Recognition Using Federated Learning
参考にはなりそう
❏ 書誌情報/著者
Konstantin Sozinov, Vladimir Vlassov, Sarunas Girdzijauskas
KTH Royal Institute of Technology所属
2018 IEEE Intl Confに掲載
❏ 論文の核心
人間活動認識 (HAR) における連合学習 (FL) の性能を集中型学習と比較評価、通信コスト、データ分布、不正クライアントの影響を調査し、実用上の課題と対策を検討
❏ 主張と革新性
高精度HARに必要な大量センサーデータの集中処理に伴うプライバシー侵害と通信コストをFLで緩和
様々なデータ分布(非IID、均一、歪んだ)がFL性能に与える影響をDNNとソフトマックス回帰モデルで検証
不正クライアントからの破損データがFLに与える影響を特定し、クライアント拒否アルゴリズムを提案
❏ 既存研究との違い
既存研究はFLの一般的な応用や通信効率化に焦点を当てるが、HARにおけるデータ分布の多様性や不正クライアントの具体的な影響評価と対策提案が不足
本研究はHARにおける実用的なデータ分布やデータ品質の問題に着目し、それらがFL性能に与える影響をDNNとソフトマックス回帰モデルで詳細に検証
❏ 技術・手法のポイント
MapReduceアルゴリズムを用いたFLプロトタイプを開発、マスターノードとクライアントワーカーで構成
ソフトマックス回帰とDNNの2種類のモデルを使用
ウィンドウ化された加速度計・ジャイロスコープデータから統計的特徴量を抽出
実ユーザーデータとシミュレーションにより生成した不正ユーザーデータを使用
クライアントへのデータ分割方法を制御し、非IID、均一、歪んだデータ分布を再現
Federated Averaging (FedAvg) を基本アルゴリズムとし、不正クライアントをテスト精度で判別・拒否するアルゴリズムを提案
❏ どう検証しているか
Heterogeneity Human Activity Recognition Datasetを使用
Google Cloud Dataproc上に構築したMapReduceプロトタイプで実験を実行
集中型学習をベースラインとして、FLの性能(精度、損失、通信コスト)をデータ分布別に評価
不正クライアントが存在する場合のFL性能劣化と、提案する拒否アルゴリズムによる改善効果を検証
歪んだデータ分布を持つクライアントのローカルテスト精度を活動別に分析
❏ 議論・今後の課題・著者自身の限界認識
FLはプライバシー保護と通信コスト削減の利点を持ちつつ、HARにおいて許容可能な精度でモデル訓練が可能
モデルの複雑さと必要な通信量・計算リソースの間にはトレードオフが存在
不正クライアントは性能を低下させるが、拒否アルゴリズムで影響を緩和できる
比較的小規模な実験であり、より大規模な実世界ワークロードでの検証が必要
今後の課題として、モバイルアプリでの実装評価や、異なる最適化アルゴリズムの検討が挙げられる
❏ 応用例/示唆
スマートデバイスを用いたヘルスケア、フィットネス、コンテキスト認識など、多様なHARアプリケーション開発に貢献
ユーザーのプライバシーに配慮し、機密性の高いセンサーデータを用いたHARモデルの訓練を可能にする
通信コストが課題となるモバイル環境でのHARモデル訓練において、コスト削減と実用的な精度を両立
不正なデータや外れ値を含む可能性のあるクライアントが存在する環境でも、比較的に堅牢なHARシステムを構築できる
各ユーザーの特定の活動に特化したパーソナルな活動認識モデルの構築も支援